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RM 99A000117 

DESCRIZIONE 

a corredo di una domanda di brevetto per invenzione industrials dal 

titolo: "Isolamento e caratterizzazione di un gene per il silenziamento 

genico da N. crassa e suoi usi" 

a nome: Universita degli Studi di Roma "La Sapienza" 

inventori: Cogoni Carlo, Macino Giuseppe 



La presente invenzione concerne I'isolamento e la ' 
caratterizzazione di un gene per il silenziamento genico da N. crassa e 

=^ 

suoi usi. g 
Piu in particolare Tinvenzione riguarda risolamento e la g 
caratterizzazione di un gene da Neurospora crassa codificante per g 
un'attivita essenziale per il processo di co-soppressione, e suoi usi e 
applicazioni in campo vegetale, animale e fungino. ^ 
Uottenimento di organism! transgenici e di grande utilita sia <s 
nella ricerca biologica di base che in quella applicata. II DNA 
transgenico viene normaimente integrate nel genoma e trasmesso 
come carattere Mendeliano. Tuttavia, in diversi casi, I'introduzione di 
transgeni induce fenomeni di silenziamentb genico (Flavell, R.B. 
1994), cioe di repressione deli'espressione del transgene stesso e/o di 
uno o piu geni omologhi endogeni. 

II silenziamento genico agisce a due livelli: trascrizionale 
(trans-inactivation) quando i transgeni contengono sequenze omologhe 
al promotore del gene silenziato (Vaucheret, 1993); e post- 



trascrizionale (co-soppressione) che richiede omologie tra le regioni 
codificanti (Flavell, 1994; Stam et al. 1997; Baulcombe, 1996). 

In generale, il silenziamento indotto da transgeni necessita di 
una quasi completa omologia di sequenza (tra 70% e 100%) tra il 
transgene e 11 gene silenziato (Elkind, 1990). 

Nel fungo filamentoso Neurospora crassa, in fase vegetativa, la 
presenza di transgeni induce un fenomeno di silenziamento genico a 
livello post-trascrizionale, denominato "quelling" (Cogoni et al. 1996). 

Attraverso I'uso del gene al-1 (albino 1) (Schmidhauser et iai. 
1990) come marcatore visuale per il silenziamento, ne sono state 
evidenziate diverse caratteristiche (Cogoni et al. 1996). In particolare, il 
"quelling" del gene al-1 in Neurospora e caratterizzato da: 1) il 
silenziamento genico e reversibile, a causa della perdita di copie dei 
transgeni; 2) la riduzione del livello basale del mRNA e dovuto a un 
effetto post-trascrizionale; 3) i transgeni contenenti almeno una regione 
di 132 coppie di basi identica alia regione codificante del gene 
bersaglio sono sufficienti ad indurre il "quelling"; 4) la duplicazione 
delle sequenze promotore e inefficace nell'indurre il silenziamento; 5) il 
"quelling" ha un comportamento dominante in eterocarion contenenti 
sia nuclei transgenic! che nuclei non trasformati, indicando il 
coinvolgimento di una molecola diffusibile, che agisce "in trans" tra i 
nuclei; 6) I'espressione di un RNA aberrante trascritto dal locus 
transgenic© § strettamente correlata con il silenziamento, suggerendo 
che il "quelling" pud essere indotto e/o mediate da una molecola di 
RNA transgenica. 



Pertanto possono essere evidenziate delle omologie tra ii 
silenziamento in Neurospora e la co-soppressione nelle piante. II 
silenziamento genico e reversibile in Neurospora, come conseguenza 
della instabilita delle copie transgeniche in fase mitotica; anche nelle 
piante la reversione della co-soppressione e associate con la riduzione 
del numero di copie di transgene, risultante dalla ricombinazione 
intracromosomale durante la mitosi o la meiosi (Mittelstein Scheid et al. 
1994; Stam et al. 1997). Quindi, sia nelle piante che in Neurospora, la 
persistenza dei transgeni e necessaria per il mantenimento del 
silenziamento. Come in Neurospora, la diminuzione del iivello basale 
del mRNA del gene silenziato e causata da un meccanismo post- 
trascrizionale (Dehio and Schell 1994; van Blokland et al. 1994; de 
Carvalho et al. 1995). Ed ancora, per Tinduzione del "quelling" e 
necessario che i transgeni contengano una porzione della regione 
codificante del gene bersaglio del silenziamento, essendo la regione 
promotore inefficace per la sua induzione. Nelle piante porzioni 
codificanti senza promotore possono indurre il silenziamento (van 
Blokland et al. 1994) e, come, nel "quelling" i promoton o i prodotti 
genici funzionanti non sono richiesti per la co-soppressione. 

Uno dei paralleli tra il "quelling" e la co-soppressione nelle 
piante e che entrambi i meccanismi sono mediati da fattori diffusibili. In 
ceppi eterocariotici di Neurospora, i nuclei in cui il gene albino 1 e 
silenziato sono in grado di indurre il silenziamento del gene al-1 
residente in nuclei non trasformati, ma che condividono un citoplasma 
comune (Cogoni et al. 1996). Nelle piante la presenza di un fattore 



diffusibile e dimostrata dal fatto che la co-soppressione e in grado di 
inibire la replicazione del Tobacco Etch Virus (TEV). un virus ad RNA 
con un cicio esclusivamente citoplasmatico. L'esistenza di fattori 
altamente diffusibili in grado di mediare la co-soppressione e stata 
dimostrata usando la tecnica di innesto in tabacco (Palaqui et al., 
1997), dimostrando che piante di tabacco silenziate sono in grado di 
trasmettere il silenziamento a piante non silenziate attraverso un 
innesto anche a grande distanza. 

11 fatto che 11 "quelling" e la co-soppressione condividano tutte 
queste caratteristiche suggerisce che i meccanismi coinvoiti ne! 
silenziamento genico post-trascrizionale nelle piante e nei funghi pud 
essere evoluto da un comune meccanismo ancestrale. 

Recentemente sono stati descritti fenomeni di inattivazione 
genica in seguito ad introduzione di transgeni anche in specie animali. 
In Drosophila melanogaster, il posizionamento di un transgene vicino a 
centri eterocromatinici determina una espressione variegata (Wallrath 
and Elgin 1995; Pirrotta, V. 1997). Simili profili d'espressione sono stati 
osservati quando ii transgene di riferimento e aH'Interno di trasposoni 
organizzati in tandem, indicando che le ripetizioni sono in grado di 
indurre la condensazione della cromatina (Dorer and Henikoff, 1994). 
Sempre in Drosophila, Pal-Bhadra et al. (1997) hanno osservato che 
I'introduzione di transgeni pud condurre a fenomeni di inattivazione 
genica, simili alia co-soppressione. 

Fenomeni di silenziamento genico dovuto a sequenze 
transgeniche ripetitive sono stati recentemente riportati nei mammiferi. 



Garrick et al. (1998) hanno generate delle linee transgeniche di topo in 
cui 100 copie transgeniche sono presenti in un unico locus ed 
organizzate in tandem diretti. E' state osservato che I'espressione del 
transgene ^ inversamente proporzionale al numero di copie presenti, 
indicando che fenomeni di silenziamento dipendenti da copie ripetute 
sono presenti anche nei mammiferi. 

L'identificazione di geni coinvoiti nel silenziamento in 
Neurospora § pertanto il primo passaggio per modulare lo stesso 
processo in plante, animali e funghi. La modulazione del silenziamento 
h di grande importanza applicativa per la produzione di organism! 
transgenici in grado di esprimere il fenotipo di interesse. 

Gli autori della presente invenzione hanno gia isolate ceppi di 
Neurospora crassa mutati in funzioni essenziali per il meccanismo di 
silenziamento genico (Cogoni and Macino, 1997): 15 mutanti 
indipendenti isolati definiscono tre gruppi di complementazione 
identificando tre geni qde-1, qde-2 e qde-3 (per qde si intenda 
"quelling" deficient), i cui prodotti sono indispensabili per il macchinario 
di silenziamento. I geni qde sono essenziali per il silenziamento in 
Neurospora, come suggerito dal fatto che il silenziamento di tre geni 
indipendenti {al-1, al-2 e qa-2) e impedito dalle mutazioni qde (Cogoni 
and Macino, 1 997). 

Gli autori della presente invenzione hanno gia identificato il 
gene qde-3 (Domanda di Brevetto Italiano No. RM98/A000730). 

Gli autori della presente invenzione hanno ora identificato e 
donate un altro dei geni qde in Neurospora, il gene qde-1, 
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identificando un altro dei fattori richiesti per il silenziamento. In 
considerazione delle similarita tra "quelling" e co-soppressione, i geni 
ortologhi al gene isolate sono coinvoiti nella co-soppressione e piu in 
generale nel silenziamento genico in altri organismi, sia piante, che 
funghi, che animali. 

Si possono individuare due ambiti generali per rapplicazione 
deirinvenzione: 1) potenziamento del silenziamento come sistema per 
inattivare in maniera piu efficace e stabile un gene d'interesse, e 2) 



soppressione del silenziamento per ottenere una migliore espressione f: i 



dei transgeni introdotti. Kil 

Per un potenziamento del silenziamento, la sovraespressione 
di uno o piu geni che controllano il fenomeno puo condurre ad una 
maggiore efficienza e/o stabilita del silenziamento deH'espressione. 
Pertanto, Tintroduzione in organismi del gene qde-1, o di geni 
omologhi, puo costituire un sistema per reprimere piu efficacemente 
funzioni geniche. In particolare, questo approccio e particolarmente 
utile nelle piante dove la co-soppressione viene comunemente usata 
per il "knock out" di funzioni geniche. Sempre nelle piante il 
potenziamento del silenziamento genico puo essere usato alio scopo di 
ottenere linee resistenti a virus patogeni, per introduzione di transgeni 
codificanti sequenze virali, al fine di ottenere Tinibizione 
deH'espressione del virus stesso (Flavell et al., 1994). 

Analoghe applicazioni sono trasponibili in ambito animate, dove 
diverse osservazioni indicano che fenomeni di silenziamento possono 



determinare I'impossibilita di un'adeguata espressione dei transgeni 
introdotti (Garrick et al. 1998). 

Al contrario vi sono casi in cui si desidera evitare e/o ridurre il 
siienziamento genico, per esempio quando s'intende sovraesprimere 
un transgene. E' noto che la co-soppressione e strettamente correlata 
sia con la presenza di un alto numero di copie di transgene, che con 
I'alta espressione dei transgeni. Questa correlazione puo rendere 
difficile ottenere organism! transgenic! che esprimono ad aiti livelli un 
transgene, in quanto piu e alta I'espressione e/o il numero di copie piu 
e probabile scatenare risposte di siienziamento. Come gia accennato, 
analoghi meccanismi di inattivazione genica, dipendenti da un alto 
numero di copie, sono stati evidenziati anche in sistemi animali. In 
questi casi linee di piante o linee animali, incapaci totalmente o 
parzialmente di silenziare, costituiscono I'ideale recipiente in cui 
sovraesprimere il transgene d'interesse. L'invenzione puo trovare 
applicazioni in questo ambito usando divers! approcci: 

A) Identificazione e produzione di linee mutanti nei gen! 
omologhi al gene qde-l in piante, animali e funghi. 

La conoscenza del gene qde-1 di Neurospora, essenziale per 
il meccanismo di siienziamento puo consentire Tisolamento di linee 
mutanti in altri organism!, negli omologhi del gene qde-1. Ad esempio, 
attraverso amplificazioni usando primers degenerati, disegnat! sulle 
region! conservate del gene qde-1, si possono identificare linee mutanti 
nei gen! omologhi, analizzando banche di mutant! per inserzione gia 
disponibili per diverse specie vegetal!. Nei fungh! e negli animali tali 
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mutanti possono essere ottenuti, una volta identificato il gene omologo, 
sfruttando le classiche tecniche di 'gene disnjption' che fanno uso della 
ricombinazione omologa. 

B) Riduzione deirespressione del gene qde-l . 

Altre strategie, per ottenere linee incapaci di silenziare, 
prevedono Tuso o del gene qde-1 di Neurospora o di geni omologhi ad 
esso. II gene qde-l od omologhi possono essere introdotti in vettori 
d'espressione opportuni ed espressi in direzione antisenso per 
bloccare I'espressione del geni endogeni resident!. Alternativamente, 
porzioni di qde-l od omologhi possono essere sovraespresse, 
neiriritento di ottenere un effetto dominante negativo, che blocchi la 
funzione dei geni qde-l endogeni. 

Gli autori della presente invenzione hanno clonato e 
caratterizzato il gene qde-1 di Neurospora crassa, L'analisi della 
sequenza del gene qde-1 ha rivelato una regione con una significative 
omologia con la sequenza di una RNA polimerasi RNA-dipendente 
isolate da pomodoro per la quale e state suggerito, ma non dimostrato, 
un coinvolgmento nel meccanismo di co-soppressione (Schiebel et al., 
1998). 

Gli autori dell'invenzione hanno per la prima volta dimostrato 
che un gene codificante per una RNA polimerasi RNA-dipedente e 
coinvolto nel silenziamento genico indotto da transgeni. Quindi, per la 
prima volta, e dimostrato che un gene appartenente alia famiglia delle 
RNA polimerasi RNA-dipedenti e un componente essenziale del 
meccanismo di inattivazione delle sequenze ripetute. 




NeH'ambito dell'invenzione il riferimento a percentuali di 
omologia va inteso come percentuale di similarity, cio§ numero di 
residui identici + numero di residui conservati, rispetto a! totale di 
residui delta sequenza considerata. 

Forma pertanto oggetto della presente invenzione una 
sequenza nucleotidica codificante per una proteina caratterizzata da! 
fatto di avere un'attivita di silenziamento e di comprendere un dominio 
di RNA polimerasi RNA-dipedente, in cui il dominio § omologo almeno 
per il 30% con la sequenza amminoacidica dairamminoacido 710 
all'amminoacido 1282 di SEQ ID No.1. Preferibilmente il dominio 6 
omologo almeno per il 40% con la sequenza amminoacidica 
dairamminoacido 710 all'amminoacido 1282 di SEQ ID No.1. Piu 
preferibilmente il dominio e omologo almeno per il 50% con la 
sequenza amminoacidica dairamminoacido 710 all'amminoacido 1282 
di SEQ ID No.1. Ancora piu preferibilmente il dominio comprende la 
sequenza amminoacidica dairamminoacido 710 all'amminoacido 1282 
di SEQ ID No.1. In una forma particolare di attuazione, la sequenza 
nucleotidica codifica per una proteina avente la sequenza 
amminoacidica di SEQ ID No.1, o porzioni funzionali di essa. Ancora 
piu preferibilmente la sequenza nucleotidica e la sequenza nucleotidica 
di SEQ ID No.1 o la sua sequenza complementare. 

Ulteriore oggetto dell'invenzione § un vettore di espressione 
comprendente sotto il controllo di un promotore esprimibile in batteri la 
sequenza nucleotidica dell'invenzione. Gli esperti del settore 
reaiizzeranno che qualsiasi plasmide in grade di esprimere in maniera 
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corretta e efficace la proteina deirinvenzione in batteri puo essere 
utilizzato e rientra neirambito deirinvenzione stessa. 

Ulteriore oggetto deirinvenzione e un vettore di espressione 
comprendente sotto il controllo di un promotore esprimibile in piante o 
in parti di esse la sequenza nucleotidioa deirinvenzione, in 
orientamento senso o antisenso. Gli esperti del settore realizzeranno 
che qualsiasi plasmide in grado di esprimere in maniera corretta e 



efficace la proteina deirinvenzione in piante o in parti di esse puo ^ 
essere utilizzato e rientra neirambito deirinvenzione stessa. m 
Ulteriore oggetto deirinvenzione e un vettore di espressione S 
comprendente sotto il controllo di un promotore esprimibile in funghi la 
sequenza nucleotidioa deirinvenzione, in orientamento senso o 



antisenso. Gli esperti del settore realizzeranno che qualsiasi plasmide ^ 
in grado di esprimere in maniera corretta e efficace la proteina 
deirinvenzione in funghi puo essere utilizzato e rientra neirambito 
deirinvenzione stessa. 

Ulteriore oggetto deirinvenzione e un vettore di espressione 
comprendente sotto il controllo di un promotore esprimibile in animali la 
sequenza nucleotidioa deirinvenzione, in orientamento senso o 
antisenso. Gli esperti del settore realizzeranno che qualsiasi plasmide 
in grado di esprimere in maniera corretta e efficace la proteina 
deirinvenzione in animali puo essere utilizzato e rientra neirambito 
deirinvenzione stessa. 

E' ulteriore oggetto deirinvenzione un organismo procariotico 
trasformato con il vettore di espressione in batteri deirinvenzione. 



E' ulteriore oggetto dell'invenzione una pianta o parti di essa 
trasformata con il vettore di espressione in piante deH'invenzione. 

E' ulteriore oggetto dell'invenzione una pianta mutata nella 
sequenza nucleotidica dell'invenzione con un'attivlta di silenziamento 
ridotta o inibita. 

E' ulteriore oggetto dell'invenzione un fungo trasformato con il 
vettore di espressione in funghi dell'invenzione. 

E' ulteriore oggetto dell'invenzione un fungo mutato nella 
sequenza nucleotidica dell'invenzione con un'attivlta di silenziamento 
ridotta o inibita. 

E' ulteriore oggetto dell'invenzione un animale non umano 
trasformato con il vettore di espressione in animali dell'invenzione. 

E' ulteriore oggetto dell'invenzione un animale non umano 
mutato nella sequenza nucleotidica dell'invenzione con un'attivlta di 
silenziamento ridotta o inibita. 

Costituisce un ulteriore oggetto dell'invenzione una proteina 
caratterizzata dal fatto di avere un'attivlta di silenziamento e di 
comprendere un dominio RNA polimerasi RNA-dipedente, in cui il 
dominio e omologo almeno per il 30% con la sequenza amminoacidica 
dall'amminoacido 710 all'amminoacido 1282 di SEQ ID No.1. 
Preferibilmente 11 dominio e omologo almeno per il 40% con la 
sequenza amminoacidica daH'amminoacido 710 aH'amminoacido 1282 
di SEQ ID No.1. Piu preferibilmente il dominio § omologo almeno per il 
50% con la sequenza amminoacidica dairamminoacido 710 
all'amminoacido 1282 di SEQ ID No.1. Ancora piu preferibilmente il 
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dominio e la sequenza amminoacidica dairamminoacido 710 
airamminoacido 1282 di SEQ ID No.1. In una forma particolare di 
attuazione, la proteina comprende la sequenza amminoacidica di SEQ 
ID No.1, 0 porzioni funzionali di essa. 

Rientra neH'ambito della presente invenzione I'uso della 
sequenza nucleotidica dell'invenzione stessa per la modulazione del 
silenziamento genico in piante, animali e funghi. 

La presente invenzione verra ora descritta in suoi esempi non 
limitativi con riferimento alle seguenti figure: 

La figura 1 illustra il ripristino dell'espressione 6\ al-1 nel ceppo 
mutante inserzionale 107. L'RNA totale e stato estratto da miceli 
prelevati dopo 10 minuti di induzione alia luce, di un ceppo silenziato 
per al-1 (6XW), di un ceppo non trasformato selvatico (WT) e del 
ceppo mutante 107. Per la ibridazione, e stata utilizzata una sonda 
specifica per al-1. La normal izzazione utilizzando una sonda specifica 
al-2 e mostrata ai dl sotto. 

La figura 2 illustra la organizzazione genomica del gene qde-1. 
a) Sono rappresentati i due cosmidi (56G11 e 40H7) in grado di 
complementare i mutanti qde-1. II riquadro chiaro nel cosmide 40H7 
rappresenta le sequenze dal vettore cosmidico. Una mappa di 
restrizione del frammento di 7.9 Kb ottenuto con EcoRI, da 40H7, 
contenente qde-1 § mostrato: E (EcoRI), P(Pst!), B(Bglll). II riquadro 
scuro rappresenta la ORF identificata aH'intemo del frammento di 7.9 
Kb di EcoRI. i plasmidi pDX e pSX contenenti i frammenti di DNA 
subclonati nei siti Xbal (X) e EcoRI (E) sono anche mostrati. b) Analisi 



Pi; 




per Southern dei ceppi 107 e WT. II DNA genomico e digerito con Bgll 
e Nael. Nel diagramma al di sotto k mostrata la sonda di DNA utilizzata 
per la ibridazione e i frammenti di restrizione Bgll/Nael (B/N) attesl. II 
triangolo rappresenta il sito di integrazione nel ceppo 107 che provoca 
una scomparsa del frammento di restrizione di 1 .0 Kb. 

La figura 3 iliustra I'espressione di qde-1 nel ceppo mutante 
inserzionale 1 07, nel ceppo selvatico non trasformato (WT) e nel ceppo 
silenziato per al-1 (6XW). L'RNA totale e stato ibridato con una sonda 
specifica per qde-1 . La quantita di RNA caricata su gel e mostrata di 
sotto. 

La figura 4 rappresenta la sequenza amminoacidica dedotta 
dal gene qde-1 . La sottolineatura indica il dominio conservato RdRP 
come mostrato nell'allineamento in figura 5. 

La figura 5 mostra un allineamento di sequenza della proteina 
QDE1 con altri polipeptidi dal database SwissProtien sequence: ORF 
di C. elegans Z488334 (elegl), ORF di S. pomde Z98553 (pom), ORF 
di A. thaliana AF080120 (araB) e la RNA polimerasi RNA dipendente 
di pomodoro Y10403 (RdRP). I resldui identici sono evidenzlati in nero, 
mentre le sostituzioni conservative sono mostrate in grigio. 
MATERIALI E METODI 
Cepoi. condizioni di crescita e trasformazione 

La metodologia e I'analisi degli eterocarion in Neurospora 
crassa d sostanzialmente la stessa di quella descrltta in (Davis and De 
Sevres, 1970). Gli sferoplasti sono stati preparati secondo il protocollo 
di Vollmer e Yasnofsky (1997). II ceppo 107 e stato Isolato come 
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segue; un ceppo silenziato per qde-l, denominato 6xw gia descritto 
(Cogoni and Macino, 1997) e stato trasformato con pMXY2 che 
contiene il gene della beta-tubulina per la resistenza al benomile, che 
funziona come marcatore selezionabile dominante in N.crassa (Staben 
et al., 1989). I trasformanti resistenti al benilato sono stati selezionati in 
base alia produzione di carotenoidi per visualizzazione del colore dei 
conidi: i selvatici erano arancioni, mentre i trasformanti da bianco a 
giallo erano indicativi di un'attivita di silenziamento. 



Plasmidi e oenoteche 

a 



II gene genomico qde-1 e stato isolate da una genoteca 
cosmidica di N.crassa (Cabibbo et a!., 1991). La subclonazione dei 
frammenti di restrizione dai cloni della genoteca e stata effettuata nel m 
plasmide pBSK Conseguentemente, i subcloni sono stati utilizzati in c3 
esperimenti di cotrasformazione utilizzando pMXY2 oppure pES200 
(contenente la resistenza per la igromicina). 
Ibridazioni Southern e Northern 

II DNA cromosomale ^ stato preparato come descritto da 
Morelli et al (1993). Dopo digestione, II DNA genomico e stato trasferito 
come descritto in Maniatis et al (1982). Le sonde sono state marcate 
per innesco casuale (Boheringer). L'RNA 6 stato sottoposto ad 
elettroforesi su gel di agarosio, trasferito su membrane Hybond-N e 
sondato. 

Analisi e seauenziamento del DNA 

La sequenza nucleotidica di qde-1 e stata determinata per 
entrambe le eliche utilizzando la TAQ FS polimerasi e il metodo 



fluorescente, e anaiizzata utilizzando un apparato automatico Applied 
Biosystems 373A: Le sequenze nucleotidiche e quella amminoacidica 
derivata sono state analizzate utilizzando il programma MacMolly 
Tetra. Un paragone delle proteine e stato effettuato con le ricerche 
BLASTP. L'algoritmo ClustalW e stato utilizzato per rallineamento. 
Risultati 

Per cionare i geni qde, e state utilizzata una mutagenesi 
inserzionale su un ceppo transgenico per al-1 (6XW) che mostra un 
fenotipo albino (bianco) come conseguenza di un silenziamento post- 
trascrizionale del gene endogeno al-1: Tra i 100.000 trasformanti 
inserzionali indipendenti, un ceppo (107) ha mostrato una reversione 
del silenziamento genico visibile come recupero di un fenotipo 
selvatico arancione. II fenotipo selvatico arancione del ceppo 107 e 
dovuto al ripristino dell'espressione del mRNA di al-1, come dimostrato 
da un'analisi Northern (si veda figure 1). Inoltre, un'ahalisi di 
eterocarion ha rivelato che la mutazione h recessiva e agisce in trans. 
L'analisi di eterocarion ha anche reso possiblle assegnare il mutante 
nel ceppo 107 ad uno dei tre gruppi di complementazione qde gia 
identificati (Cogoni and Macino 1997). II restauro di un fenotipo 
silenziato per al-1 awiene in eterocarion con mutanti qde-2 e qde-3. 
Non e possibile complementare con mutanti qde-1 (Tabella 1), 
indicando che il ceppo 107 e mutato nel gene qrde-1 . 



Tabella 1-11 ceppo 107 e mutato nel gene qde-1 





Ceppi mutanti qde utilizzati in eterocarion specifici 




107 


M17 


M18 


M10 


M11 


M7 


M20 


107 
1 U/ 


WT 


AL 


AL 


AL 


AL 


WT 


WT 


IVI 1 / 




WT 


WT 


AL 


AL 


AL 


AL 


IVI 1 O 






WT 


AL 


AL 


AL 


AL 


IVI 1 u 








WT 


WT 


AL 


AL 


M11 










WT 


AL 


AL 


M7 












WT 


WT 


M20 














WT 



WT= eterocarion con fenotipo selvatico per Taccumulo di carotenoidi 
(arancione); AL= eterocarion con fenotipo albino in cui il silenziamento 
del gene al-1 e ripristinato. i mutanti qde sono stati descritti in Cogoni 
and IVIacino (1997): M17 e M18 sono mutanti qde-3\ M10 e M11 sono 
mutanti qde-2; M7 e M20 sono mutanti qde-1. I fenotipi degli 
eterocarion sono statI esaminati per Ispezlone vislva dopo sette giorni 
dl crescita alia luce. 

Per isolare II gene qde-1, il plasmide "tagging" e stato 
recuperate da! ceppo 107 con una procedura di liberazione del 
plasmide, utilizzando I'enzima dl restrizione Sg/ll che ha un singolo sito 
di restrizione all'lnterno del plasmide tagging. Un plasmide, pCR4 e 
stato recuperate dopo rillgazione del DNA cromosomale a seguito di 
restrizione con Bgl\\ (si veda figura 2a). II DNA cromosomale che 
flancheggia il sIto di inserzione e stato isolate utilizzando gli enzimi 
Sg/ll e Psti e il frammento di restrizione risultante e stato utilizzato 
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come sonda su una genoteca cosmitica di N.crassa. Due cosmidi 
ibridizzanti positivi 56G11 e 40H7 sono stati introdotti con un 
esperimento di trasformazione nel ceppo 107 e nel ceppo mutante per 
qde-l M7 indotto per UV. EntrambI i cosmidi sono in grade di 
complementare i due mutanti qde-1 saggiati. II ripristino del 
siienziamento del gene al-1 che conduce alia comparsa di un fenotipo 
bianco, indica che entrambi i cosmidi contengono un gene qde-1 
funzionale. Utilizzando lo stesso DNA fiancheggiante come sonda, due 
frammenti di EcoRI da 40H7 e da 56G11, rispettivamente di 7.9 e 10.0 
Kb, sono stati identificati e subclonati (si veda figure 2a). Entrambi i 
frammenti di EcoRI (plasmidi P79E e p10E) sono in grado di 
complementare il ceppo qde-1 (107 e W), ma non i ceppi mutanti in 
qde-2 (M10) e qde-3 (M17) (Tabella 2) indicando che il gene funzionale 
qde-1 e contenuto nel frammento EcoRI di 7.9 Kp. 



Tabella 2 Complementazione con il gene qde-1 



Plasmidi 


ceppi mutanti qde utilizzati 


107 


M7(qde-r) 


M10(qde-2-) 


M17(qde-3") 


P79E 


58/200(29%) 


48/200(24%) 


0/200(0%) 


0/200(0%) 


P10E 


51/100(25%) 


25/100(25%) 


0/200(0%) 


0/200(0%) 


PSX 


0/200(0%) 


0/200(0%9 






PDX 


0/200(0%) 


0/200(0%) 


0/200(0%) 


0/200(0%) 



La frequenza di complementazione § riportata come percentuale dei 
ceppi trasformanti che mostrano un fenotipo albino rispetto al numero 
totale di trasformanti. II plasmide pMXY2 e stato usato come controllo 
negative. 



II fatto Che il gene qde-1 sia in grado di ripristinare il 
silenziamento del gene al-1 solo nei mutant! corrispondenti, esclude la 
possibilita che il frammento di DNA clonato sia in grado di riattivare il 
silenziamento del gene a\-1, a prescindere dal gmppo di 
complementazione qde. Inoitre, il ceppo M7 trasfomnato con il 
frammento di 7.9 Kb EcoRI conferisce una capacita di silenziare un 
altro gene carotenogenico al-2, quando introdotto per trasformazione 
(dati non mostrati). II frammento EcoRI di 7.9 Kb e stato ulteriormente 
subclonato utilizzando il sito Xbal (si veda figure 2a) che taglia al 
centre del frammento EcoRI. Entrambi i frammenti Xbal/EcoRI (plasmidi 
pSX e pDX) non erano in grado di complementare i ceppi 1 07 e M7 (si 
veda Tabella 2), suggerendo che il sito Xbal e probabilmente 
localizzato aH'interno del gene qde-1. 

L'intera regione del frammento EcoRI che comprende il gene 
qde-1 putative e le regioni adiacenti sono state sequenziate, rivelando 
una cornice di lettura aperta (ORF) di 4206 bp che codifica per una 
proteina putativa di 1402 amminoacidi. Due risultati diversi indicano 
che questa ORF e coincidente con il gene qde-1. In primo luogo, il sito 
di restrizione Xbal utilizzato per subclonare il frammento di 7.9 Kb 
EcoRI e localizzato al centre della ORF (figura 2a), ed e pertanto 
consistente con il risultato che entrambi i frammenti Kbal/EcoRI non 
siano in grado di complementare la mutazione qde-1 (Tabella 2). In 
secondo luogo, per analisi Southern (si veda figura 2b) il sito di 
inserzione del plasmide tagging nel ceppo 107 e stato mappato 
aH'interno dei siti di restrizione Bglll e Nael aH'interno della ORF. Non e 



stata rivelata alcuna alterazione di dimensione delle regioni 
fiancheggianti, escludendo la possibilita che le delezioni comprendano 
altre ORF airinterno della regione di 7.9 Kb di EcoRL I cDNA, 
sintetizzati per PGR inversa (RT-PCR), hanno rivelato una colinearita 
con 11 DNA genomico indicando che non e presente alcun introne. 
Lespressione del gene qde-l e stata analizzata per analisi Northern 
utilizzando una sonda che comprende la ORF di qde-l (figure 2a). E' 
stato cosi rivelato un trascritto di circa 5000 nt, e il livello basale di 
mRNA di qde-1 e risultato essere due volte piu alto in un ceppo 
silenziato per al-l (6XW) rispetto ad un ceppo WT non trasformato (si 
veda figura 3). Inoltre, TmRNA di intera lunghezza di qde-l non e 
rivelabile nel ceppo mutante inserzionale 107 di qde-1, dove invece 
una banda piu piccola e presente suggerendo che i trascritti troncati di 
qde-1 sono prodotti come conseguenza deirintegrazione. II fatto che 
i'espressione genica di qde-l sia aumentata in maniera specifica in un 
ceppo silenziato indica Tesistenza di un meccanismo regolativo in 
grade di attivare componenti cellulari del macchinario di silenziamento 
nei ceppi trasgenici. 

La proteina QDE-1 dedotta dalla sequenza nucleotidica e 
composta di 1402 amminoacidi (si veda figura 4) ed ha un peso 
molecolare di 158.004 Da ed un pi statistico di 8.0. La proteina QDE-1 
non contiene un peptide segnale o un dominio transmembrana, 
indicando che e probabilmente una proteina intracellulare. Inoltre, il 
plot di idropatia indica che QDE-1 e una proteina solubile. Una ricerca 
BLAST ha mostrato che qde-1 ha una omologia statisticamente 
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significativa con proteine ipotetiche da diversi altri organismi 
comprendenti: due ORF di C.elegans (numeri di accesso EMBL Z4B34 
e Z78419) con valori attesi (valore E) di 2e-16 e 9e-10 rispettivamente; 
una ORF di S.pombe (numero di accesso EMBL Z9B553) con un valore 
E 3e-13; quattro ORF di A.thaliana (numeri di accesso EMBL 
AF080120, AC005169 comprendente tre ORF alia stessa 
localizzazione cromosomale) e con un valore E 8e-15, 7e-06, 4e-05, 
5e-02, rispettivamente. Infine e state trovata una omologia significativa 
(valore E 2e-17) con una proteina putativa codificata da un cDNA di 
pomodoro (numero di accesso EMBL Y10403). L'omologia trovata non 
si estende per Tintera proteina, ma e ristretta ad una porzione di 570 
amminoacidi, dalFamminoacido 710 all'amminoacido 1282, che 
definisce un dominio conservato (si veda figure 5). Tra le proteine 
putative omologhe identificate, solo quella derivata dalla sequenza del 
cDNA di pomodoro e stata caratterizzata in maniera funzionale come 
una RNA polimerasi RNA dipendente (RdRP, 9). 



SEQUENCE LISTING 
<110> Universita' degli Studi di Roma "La Sapienza" 
<120> Isolamento e caratterizzazione di un gene per il 

silenziamento genico da N. crassa e suoi usi 
<160> 2 

<170> Patentln Ver. 2.0 
<210> 1 
<2li> 8045 
<212> DNA 

<213> Neurospora crassa 
<221> CDS 

<222> (2447) . . (6655) 



<4 00> 1 ^ 
ggtaccgggc cccccctcga ggtcgacggt atcgataagc ttgatatcga attctgaaaa 60 ^ 
gtcctaaagt ctcctgtctc tcatgctagg tagccctact gcgtgtgtag tgtagtaggt 120 ^ 
ccgaataggt tcgtacgctg tcccctttag ggggctggtt taacagggag acagggtaca 180 
gtctctcggg aacagagacg accaagcttt gttgtgtgac atcatcttga gaccattcgt 240 
ctgagggtcc atacaaccat acatgctgtg tagagagtgg tgggaatatt agaggttact 300 
ttgagagttt ctgaagagat tgagactgta ggtacgttca tttatcggtg cgacgagaat 360 
gggcacgcat gagtcgacat ttgcaatttg ttggttggca cgcacatcga tagtgtacac 420 
atgtgtcggc ctgagactgt ccaatggacc aatggtaagg cgtgagcggc gagtggggtc 480 
aacttgaggt taatgtacac agtacttgag gctgtagcgg gcagcggaag catccgtcct 540 
cgaatggaca ttcccaagcc agccaacact ggtgtccatt taaaagcgtt ttctccatgg 600 
gggaacaatg gccggcgtag tatctgtaag aggacctaga ggacggtatt agaacatttg 660 
ggtgatgtat ctagatcacc gatgtgtccc tgaatagtcc atgaatagtc tgggatgagt 720 
ccgagatcag tccgggatgt gtcaccgata tatccatgac ttatctctga tttatcccag 780 
cgagacccca atcagtatga ccgacagcga caccatcacc ggcgccagcg tatgagatcc 840 
tgaacatatg ttaggcatat gtatggcata tgtatgcata gagcatgcac. cacatatctg 900 
agagctgcct gtgactacct agaggtatgt agaggtaatg tcacgtacct tacctctacc 960 
aaatgtatcc cgcagtcact cgtattcccg ctgtagtgta cactagaact agccccgcct 1020 
tttggatcct ggagtgtccc cattccacgc acttgccaag aaccacaacc tcgcaaagcg 1080 
cgctgacagg gcaccgtgct gcctggacct ttgcgggccg ttccttcttg accggcgcca 1140 
ggcagcagac cggttggttc ttgttcctca aggtgacgaa ggcgattaaa aaatccaaga 1200 
caaccagatc ctggaacctt tgatcatccc tcgtttactc agacgaaaaa actaaaaaac 1260 
ttcaaagtcg ttgtcagatt aattgaaccg ttaaaacagg acatgtccgc cctttcgtct 1320 
ctcatgccct cgaaacctca cgtcttccat ctctcgtccg atccccccct ccccacgacc 1380 
ctgattcagc agcgaactga cctgtcactt tactgtggac tcctcctaga gtagggctgg 1440 
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ccatccccgg gccccctgca gcttctgcaa gtcaaagcga tggaaggatg gccgtccagt 1500 
gggtgcggca tacagccatt tccaaaatgg tctcgtcgca tgcggaagaa aaaaaatgga 1560 
aggctacgag cctgcgacac ctgtacggtc actgcggcta cccttcacca ccaccagtga 162 0 
tatcatcacc cataccatca gggccactac cgccgcgctc tctcgaacat cgggctgaat 1680 
gtgaccaatt gcgccgacag cgggcttttc gatcctgtgg gcagcttctt ccaccggttt 1740 
gcgctgatct gggagcgtat cgagctggat tgggactgtt taccactcga atcacttgac 1800 
ggctcggcgc gattctatgg ccatccaccg cgattgatcg gtcccttcac tgtttcctgc 1860 
aacctactct cccgaccaga tcagacgagg ctttatgccc agttccgggc gttgccaatt 1920 
atagccacag cacgaagctc gccaagttcg ttcgaaatgc tcaaaactgt tcacacactt 1980 
tgcacgaaca ggaccaccac gaaaaaccac cttggcccgc tcgcgcgaac ccgtgtcttt 2040 
gaactcgatc agccccaatc ccaaaccagg tcgcctttcc ccgctgcgcc tgcttgtccc 2100 
gacttcgtga agcaaacaag actggcggct atggccaagg cccattccat gacaattggt 2160 ---^ 
taatcgaggt caaaaactac aagagatcaa cgccgcaaag atatacttgt cgttcacccc 2220 c;; 
gacaaccgca aagccttgaa gcgcaaagcc acagtggtgt tgtttacttc cgcacactta 2280 ^ 
tcgaccctta cgcccaagac gctcccgctt ggtagaagct cgagtcgggt aatcaggtat 2340 ^ 
atctcacagt cgccttgtcc tccttttcgg tggtggtcgc ttttatcatg ccttatcgct 2400 ^ 
aacccggttg tatactctac tccaggcccg atctcccacg gcacaa atg aac cct 2455 

Met Asn Pro 

1 _ 
att act cct agg aag agg aat age ccc gtc gag gaa ate ata aac egg 2503 ^ 
lie Thr Pro Arg Lys Arg Asn Ser Pro Val Glu Glu lie lie Asn Arg gg^ 

5 10 15 

etc aat aac gac tac aac ctg gge etc cag tgt gtc gca gae aca act 2551 
Leu Asn Asn Asp Tyr Asn Leu Gly Leu Gin Cys Val Ala Asp Thr Thr 
20 25 30 35 

etc ace ccc cae ege egg aag gag ctg gee gag agt gae gag gat tte 2599 
Leu Thr Pro His Arg Arg Lys Glu Leu Ala Glu Ser Asp Glu Asp Phe 

40 . 45 50 

ggt ege cat gae aag ate tac aga gee etg aae ttt etc tac tgg egg 2647 
Gly Arg His Asp Lys lie Tyr Arg Ala Leu Asn Phe Leu Tyr Trp Arg 

55 60 65 

aag gat gac tee ctg aac cag gea gaa gee aac ttc tte ate gag gee 2695 
Lys Asp Asp Ser Leu Asn Gin Ala Glu Ala Asn Phe Phe lie Glu Ala 

70 75 80 

aaa get geg age teg aac tgg gtg ecc aaa gee cae gee gae cct gae 274 3 
Lys Ala Ala Ser Ser Asn Trp Val Pro Lys Ala His Ala Asp Pro Asp 

85 90 95 

acg ett ceg tgg tec aag gaa cct ecc ege gee get act gee gge eaa 2791 
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Thr Leu Pro Trp Ser Lys Glu Pro Pro Arg Ala Ala Thr Ala Gly Gin 

100 105 110 115 

caa tgg gca ttg cag act gtg ttg etc gag gtg ctt aat agg ttt atg 2839 

Gin Trp Ala Leu Gin Thr Val Leu Leu Glu Val Leu Asn Arg Phe Met 

120 125 130 

cca cct ccc aat aac aca cca ggt cga acg ttt ggc aga act eta age 2887 

Pro Pro Pro Asn Asn Thr Pro Gly Arg Thr Phe Gly Arg Thr Leu Ser 

135 140 145 

ggc cca agt ggc ctg age cge cca ace tct acc aac acc aaa cgc aag 2935 

Gly Pro Ser Gly Leu Ser Arg Pro Thr Ser Thr Asn Thr Lys Arg Lys 

150 155 160 

gat gag ccc gee aat gte act ttc get gat ecg ccc aaa cgc teg ttg 2983 

Asp Glu Pro Ala Asn Val Thr Phe Ala Asp Pro Pro Lys Arg Ser Leu . ; 

165 170 175 - 

(5 ■ 

act cge tct gee aca ggt cct cct att eae ggc gcg gcg ata cee eta 3031 ^ 
Thr Arg Ser Ala Thr Gly Pro Pro lie His Gly Ala Ala lie Pro Leu ^ 
180 185 190 195 ^ 

aag ttc ccc gat cca gtg aat acc ggt tec aaa cga cca tct etc gag 3079 
Lys Phe Pro Asp Pro Val Asn Thr Gly Ser Lys Arg Pro Ser Leu Glu 

200 205 210 ^ 

agt gag aat etc aat cag tgc acc aag egg gcc aag ggc aag ctg tct 3127 
Ser Glu Asn Leu Asn Gin Cys Thr Lys Arg Ala Lys Gly Lys Leu Ser 

215 220 225 

gat aat gtt gee get gee gcc gee ccg ccc gtg ect att gcg age get 3175 
Asp Asn Val Ala Ala Ala Ala Ala Pro Pro Val Pro lie Ala Ser Ala 

230 235 240 

ttg gae aag gta ccg act cga agg cat gee aat acg aga gat ccc acg 3223 
Leu Asp Lys Val Pro Thr Arg Arg His Ala Asn Thr Arg Asp Pro Thr 

245 250 255 

gcg aca ggt eat aga cga gcg gae cag gtg gat tec ttt gat aca tct 3271 
Ma Thr Gly His Arg Arg Ala Asp Gin Val Asp Ser Phe Asp Thr Ser 
260 265 270 275 

caa ggc act tec tat ggt teg agt gte ttc age get tgc egt cac aat 3319 
Gin Gly Thr Ser Tyr Gly Ser Ser Val Phe Ser Ala Cys Arg His Asn 

280 285 290 

cag age act ace cag agt agt ttt gag get cct ect tea cag ccc aga 3367 
Gin Ser Thr Thr Gin Ser Ser Phe Glu Ala Pro Pro Ser Gin Pro Arg 
295 300 305 
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gag 
Glu 

gag 
Glu 

ccc 
Pro 
340 
gag 
Glu 

cgc 
Arg 

caa 
Gin 

aaa 
Lys 

gtt 
Val 
420 
ctg 
Leu 

gat 
Asp 

ttt 
Phe 

aac 
Asn 

tac 
Tyr 



aag egg 
Lys Arg 
310 
tct cct 
Ser Pro 
325 

ctt tea 
Leu Ser 

teg ttt 
Ser Phe 

tea aat 
Ser Asn 

gtt eat 
Val His 
390 
ttt ecc 
Phe Pro 
405 

aee aga 
Thr Arg 

gge eta 
Gly Leu 

ate tgg 
lie Trp 



cct gtg gat gee 
Pro Val Asp Ala 



cca 
Pro 

ttt 
Phe 
485 
aat 
Asn 



gaa 
Glu 
470 
gag 
Glu 

ecg 
Pro 



age 
Ser 

teg 
Ser 

cca 
Pro 

gga 
Gly 
375 
gee 
Ala 

aaa 
Lys 

etc 
Leu 

aag 
Lys 

aag 
Lys 
455 
aag 
Lys 



aaa gga aga 
Lys Gly Arg 
330 

tct tec cag 
Ser Ser Gin 

345 
agt tec ggc 
Ser Ser Gly 
360 

ctg get egg 
Leu Ala Arg 

ccg gtg gtt 
Pro Val Val 



tgg eta 
Trp Leu 

ttt atg 
Phe Met 
425 
tac gac 
Tyr Asp 
440 

act etc 
Thr Leu 



cae 
His 
410 
cae 
His 

cct 
Pro 

tac 
Tyr 



ccg ccc aac 
Pro Pro Asn 



age aaa ggt agt 
Ser Lys Gly Ser 
490 

gac aac teg cct 
Asp Asn Ser Pro 



aeg gtc 
Thr Val 
315 

aca ace 
Thr Thr 

ggt gaa 
Gly Glu 

gge gag 
Gly Glu 

age gaa 
Ser Glu 
38 0 
gea get 
Ala Ala 
395 

gaa get 
Glu Ala 

tgc aaa 
Cys Lys 

tec tgg 
Ser Trp 

egg ctt 
Arg Leu 
460 
gac gtg 
Asp Val 
475 

gee gtt 
Ala Val 

act geg 
Thr Ala 



ttt gag get 
Phe Glu Ala 

aag tec cae 
Lys Ser His 
335 

act teg tte 
Thr Ser Phe 

350 
ggc gea att 
Gly Ala He 
365 

gaa age get 
Glu Ser Ala 

egg ctg aga 
Arg Leu Arg 

cct etc get 
Pro Leu Ala 
415 

gta gac ttg 
Val Asp Leu 

430 
tct ace geg 
Ser Thr Ala 
445 

gat get tte 
Asp Ala Phe 

tte gtg aee 
Phe Val Thr 

gtt etc tct 
Val Leu Ser 
495 

ccc ctt tac 
Pro Leu Tyr 



gga eac ttg att 
Gly His Leu lie 
320 

ata gat aac cag 
He Asp Asn Gin 



age act 
Ser Thr 

ccc gag 
Pro Glu 

ega tct 
Arg Ser 
385 
aat att 
Asn He 
400 

gtt gea 
Val Ala 



tac 
Tyr 

ccg 
Pro 
370 
cag 
Gin 



tat 
Tyr 
355 
agt 
Ser 

gtt 
Val 



tgg ccg 
Trp Pro 

tgg gaa 
Trp Glu 



gaa gac gag age 
Glu Asp Glu Ser 
435 

cgc gat gtc aca 
Arg Asp Val Thr 
450 

cgt ggt aaa ccc 
Arg Gly Lys Pro 
465 

gea atg acg ggc 
Ala Met Thr Gly 
480 

get gtt eta gac 
Ala Val Leu Asp 

ctt gtg aag ctg 
Leu Val Lys Leu 



3415 



3463 



3511 



3559 



3607 



3655 



3703 



3751 



3799 



3847 



3895 



3943 



3991 




500 505 510 515 

aag ccg etc atg ttc gag cag ggc tgt cga etc ace cgt egg ttc ggt 4039 

Lys Pro Leu Met Phe Glu Gin Gly Cys Arg Leu Thr Arg Arg Phe Gly 

520 525 530 

cct gat agg ttt ttc gag ate ctt ata ccg teg cct aeg age acc age 4087 

Pro Asp Arg Phe Phe Glu lie Leu lie Pro Ser Pro Thr Ser Thr Ser 

535 540 545 

cca agt gta ccg ccg gtg gtc age aaa caa eca ggt gcg gtc gaa gaa 4135 

Pro Ser Val Pro Pro Val Val Ser Lys Gin Pro Gly Ala Val Glu Glu 

550 555 560 

gtc ate cag tgg etc aeg atg ggg caa eat tet ctt gta ggc cgc caa 4183 

Val lie Gin Trp Leu Thr Met Gly Gin His Ser Leu Val Gly Arg Gin 
565 570 575 



tgg cgc get ttc ttc gee aaa gat gee gga tac agg aaa cct etc agg 4231 
Trp Arg Ala Phe Phe Ala Lys Asp Ala Gly Tyr Arg Lys Pro Leu Arg ^ 
580 585 590 595 ^ 

gag ttc cag etc cgc gee gag gae ccg aaa cec ate ate aag gag aga 4279 ^ 
Glu Phe Gin Leu Arg Ala Glu Asp Pro Lys Pro lie lie Lys Glu Arg 

600 605 610 

gtc eac ttc ttt gee gag acc ggc att aeg ttc cga cct gat gtg ttc 4327 g 
Val His Phe Phe Ala Glu Thr Gly lie Thr Phe Arg Pro Asp Val Fhe ^ 

615 620 625 

aag aeg aga tet gtc gtt ccg gca gag gaa cct gta gag caa egg acc 4375 
Lys Thr Arg Ser Val Val Pro Ala Glu Glu Pro Val Glu Gin Arg Thr 

630 635 640 

gag ttc aaa gtt agt caa atg ctg gae tgg etc ctg caa etc gae aac 4423 
Glu Phe Lys Val Ser Gin Met Leu Asp Trp Leu Leu Gin Leu Asp Asn 

645 650 655 

aac act tgg cag ccg eac etc aag ttg ttc tec cgt ate cag etc ggt 4471 
Asn Thr Trp Gin Pro His Leu Lys Leu Phe Ser Arg lie Gin Leu Gly 
660 665 670 675 

ctg agt aag aca tat gee att atg aca ttg gag cct eac cag ate aga 4519 
Leu Ser Lys Thr Tyr Ala He Met Thr Leu Glu Pro His Gin He Arg 

680 685 690 

eac eac aag ace gat ctt ctt tea cct tea ggc act ggc gaa gtg atg 4567 
His His Lys Thr Asp Leu Leu Ser Pro Ser Gly Thr Gly Glu Val Met 

695 700 705 

aat gae ggt gta ggc cgc atg teg cga age gtg gee aag agg ata cgc 4615 
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Asn 

gat 
Asp 

ggt 
Gly 
740 
gag 
Glu 

ttc 
Phe 

gaa 
Glu 

gat 
Asp 

ctt 
Leu 
820 
aat 
Asn 

cgc 
Arg 

cct 
Pro 

gat 
Asp 

aag 
Lys 
900 



Asp Gly Val Gly Arg Met 
710 

gtt etc ggt ttg 
Val Leu Gly Leu 
725 

teg gee aag gga 
Ser Ala Lys Gly 



gat tgg 
Asp Trp 

gtt gat 
Val Asp 



etg 
Leu 

aga 
Arg 
805 
ate 
He 



aag 
Lys 
790 
gee 
Ala 

aae 
Asn 



cgc cca 
Arg Pro 

gca act 
Ala Thr 

gac agt 
Asp Ser 
870 
cec aag 
Pro Lys 
885 

egg aaa 
Arg Lys 



ate gag 
He Glu 
760 
aaa eat 
Lys His 
775 

tea get 
Ser Ala 

agg gae 
Arg Asp 

gat ttg 
Asp Leu 

gtg gaa 
Val Glu 
840 
cga gtc 
Arg Val. 
855 

caa gag 
Gin Glu 



ggt gat 
Gly Asp 
730 
atg tgg 
Met Trp 
745 

aea tac 
Thr Tyr 

caa egt 
Gin Arg 

ggt etc 
Gly Leu 

aag gtg 
Lys Val 
810 
caa ega 
Gin Arg 
825 

ttt cgc 
Phe Arg 

age cac 
Ser His 

gag aca 
Glu Thr 



Ser Arg Ser 
715 

gtg ece tet 
Val Pro Ser 

gtt ate gae 
Val He Asp 



Val Ala Lys Arg He Arg 
720 

caa ggg egg ttt 
Gin Gly Arg Phe 



ecg 
Pro 

aee 
Thr 

aae 
Asn 
795 
aag 
Lys 



tee 
Ser 

etc 
Leu 
780 
eta 
Leu 



eag 
Gin 
765 
gaa 
Glu 

eag 
Gin 



atg cgc 
Met Arg 



aag caa aag tac 
Lys Gin Lys Tyr 
890 

tgt gac acg ttg 
Cys Asp Thr Leu 
905 



eag ttc age 
Gin Phe Ser 

caa tgg gtt 
Gin Trp Val 
845 

ggc egt gtg 
Gly Arg Val 

860 
etg aae ttc 
Leu Asn Phe 
875 

ttg eaa gac 
Leu Gin Asp 

aag tec aag 
Lys Ser Lys 



get gtg 
Ala Val 
735 
gtt gae 
Val Asp 
750 

cgc aag 
Arg Lys 

gte egg 
Val Arg 

etg tta 
Leu Leu 

cag gca 
Gin Ala 
815 
gag eaa 
Glu Gin 
830 

tac gag 
Tyr Glu 

cct ttt 
Pro Phe 

ttg atg 
Leu Met 

ate gee 
He Ala 
895 
etg aae 
Leu Asn 
910 



gac aca 
Asp Thr 

tgg gaa 
Trp Glu 

age gtg 
Ser Val 
785 
cct gtc 
Pro Val 
800 

ate ggt 
He Gly 

aag cat 
Lys His 

agt tat 
Ser Tyr 

ett get 
Leu Ala 
865 
aae agt 
Asn Ser 
880 

tgg gat 
Trp Asp 



ggc gat 
Gly Asp 
755 
tge gae 
Cys Asp 
770 

get tet 
Ala Ser 

etg gaa 
Leu Glu 

gac egt 
Asp Arg 



get 
Ala 

tec 
Ser 
850 

ggg 

Gly 



ttg 
Leu 
835 
agt 
Ser 

eta 
Leu 



ggg ttc 
Gly Phe 

ctt eaa 
Leu Gin 



ate egt gte ggt 
He Arg Val Gly 
915 



4663 



4711 



4759 



4807 



4855 



4903 



4951 



4999 



5047 



5095 



5143 



5191 



^^^^ 

t .5 
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cga tea gca tac att tac atg att gcc gat ttc tgg ggt gtg ctt gag 5239 
Arg Ser Ala Tyr lie Tyr Met lie Ala Asp Phe Trp Gly Val Leu Glu 

920 925 930 

gaa aat gag gtt cat gtc gga ttc tec tea aag ttc aga gac gag gag 5287 
Glu Asn Glu Val His Val Gly Phe Ser Ser Lys Phe Arg Asp Glu Glu 

935 940 945 

gag tct ttt aca etc eta teg gac tgt gat gtc etc gtg gcg cga tec 5335 
Glu Ser Phe Thr Leu Leu Ser Asp Cys Asp Val Leu Val Ala Arg Ser 

950 955 960 

cea gee eat ttc cet agt gat ate caa egg gtt cga gca gtc ttc aag 5383 
Pro Ala His Phe Pro Ser Asp lie Gin Arg Val Arg Ala Val Phe Lys 

965 970 975 ^ 

cea gag etc cac agt etc aag gat gta ate ate ttc tct act aaa gga 5431 ^ 
Pro Glu Leu His Ser Leu Lys Asp Val lie lie Phe Ser Thr Lys Gly 
980 985 990 995 0 

gat gta ccg ctt get aag aag eta tct ggt gga gac tac gac ggc gat 5479 ^rvj 
Asp Val Pro Leu Ala Lys Lys Leu Ser Gly Gly Asp Tyr Asp Gly Asp ^''^'•'■'^ 
1000 1005 1010 «^ 



atg gee tgg gtc tgc tgg gat ccg gag ate gtc gat ggt ttc gtc aat 5527 



Met Ala Trp Val Cys Trp Asp Pro Glu lie Val Asp Gly Phe Val Asn ^ 
1015 1020 1025 Cri 

gcg gaa atg cet ctg gag cec gac etg tct agg tac eta aag aag gac 5575 
Ala Glu Met Pro Leu Glu Pro Asp Leu Ser Arg Tyr Leu Lys Lys Asp 

1030 1035 1040 

aaa acg act ttc aaa caa ctt atg gee tea cac ggc aeg ggc tea gcg 5623 
Lys Thr Thr Phe Lys Gin Leu Met Ala Ser His Gly Thr Gly Ser Ala 

1045 1050 1055 

gcc aaa. gag, cag act aca tac gat atg ate cag aag age ttc eat ttc 5671 
Ala Lys Glu Gin Thr Thr Tyr Asp Met lie Gin Lys Ser Phe His Phe 
1060 1065 1070 1075 

gcc ctg cag cec aac ttc ttg ggc atg tgc act aac tac aaa gaa agg 5719 
Ala Leu Gin Pro Asn Phe Leu Gly Met Cys Thr Asn Tyr Lys Glu Arg 

1080 1085 1090 

etc tgt tac ate aac aat agt gtg tct aac aag ccg gcc ate att ctt 5767 
Leu Cys Tyr lie Asn Asn Ser Val Ser Asn Lys Pro Ala lie lie Leu 

1095 1100 1105 

agt tea etg gtg gga aac etc gtc gat cag age aag caa ggt att gtc 5815 
Ser Ser Leu Val Gly Asn Leu Val Asp Gin Ser Lys Gin Gly lie Val 



1110 1115 1120 

ttt aac gaa gca age tgg get caa ttg cgt agg gaa ctg ctt ggc ggt 5863 
Phe Asn Glu Ala Ser Trp Ala Gin Leu Arg Arg Glu Leu Leu Gly Gly 

1125 1130 1135 

gca ttg tec ctt cet gac eca atg tac aag age gac agt tgg etc ggg 5911 
Ala Leu Ser Leu Pro Asp Pro Met Tyr Lys Ser Asp Ser Trp Leu Gly 
1140 1145 1150 1155 

cgc gga gag cct ace eac att att gac tac ctg aaa ttc tee ate gee 5959 
Arg Gly Glu Pro Thr His lie lie Asp Tyr Leu Lys Phe Ser lie Ala 

1160 1165 1170 

agg cct gcg att gac aag gaa ctg gaa gee ttc eac aat gcc atg aaa 6007 
Arg Pro Ala lie Asp Lys Glu Leu Glu Ala Phe His Asn Ala Met Lys 

1175 1180 1185 

gcg gee aag gat aca gaa gac ggc get eac ttt tgg gat ceg gat etc 6055 
Ala Ala Lys Asp Thr Glu Asp Gly Ala His Phe Trp Asp Pro Asp Leu 

1190 1195 1200 

get tec tac tac aeg tte ttc aag gag att age gac aag teg cga teg 6103 
Ala Ser Tyr Tyr Thr Phe Phe Lys Glu lie Ser Asp Lys Ser Arg Ser 

1205 1210 1215 

tec gca ctg eta tte aeg act ctg aag aac cgt ate ggc gaa gtc gag 6151 
Ser Ala Leu Leu Phe Thr Thr Leu Lys Asn Arg lie Gly Glu Val Glu 
1220 1225 1230 1235 

aaa gaa tat ggc agg ttg gtc aaa aac aag gag atg aga gac age aag 6199 
Lys Glu Tyr Gly Arg Leu Val Lys Asn Lys Glu Met Arg Asp Ser Lys 

1240 1245 1250 

gac eee tac cct gtc cgc gtc aac cag gtt tat gaa aaa tgg tgc gcc 6247 
Asp Pro Tyr Pro Val Arg Val Asn Gin Val Tyr Glu Lys Trp Cys Ala 

1255 1260 1265 

ate aeg cct gag gcg atg gac aaa tec gga gca aat tat gat tet aag 6295 
lie Thr Pro Glu Ala Met Asp Lys Ser Gly Ala Asn Tyr Asp Ser Lys 

1270 1275 1280 

gtg ate agg ttg ctg gag ctg tec ttc etc gcg gac cgt gag atg aat 6343 
Val lie Arg Leu Leu Glu Leu Ser Phe Leu Ala Asp Arg Glu Met Asn 

1285 1290 1295 

aca tgg gca ttg ctg agg get age aeg get tte aag ctg tac tac eac 6391 
Thr Trp Ala Leu Leu Arg Ala Ser Thr Ala Phe Lys Leu Tyr Tyr His 
1300 1305 1310 1315 

aag age ccc aag ttc gtg tgg cag atg gcg ggc aga cag etc gcg tac . 64 39 



erg 



«3 
S5 




30 



Lys Ser Pro Lys Phe Val Trp Gin Met Ala Gly Arg Gin Leu Ala Tyr 

1320 1325 1330 

att aag gcg cag atg acg age aga ccc ggt gaa ggc gcc ccg gcg ttg 6487 
lie Lys Ala Gin Met Thr Ser Arg Pro Gly Glu Gly Ala Pro Ala Leu 

1335 1340 1345 

atg acc gcg ttc atg tat gcg ggc ttg atg ccg gat aag aag ttt acg 6535 
Met Thr Ala Phe Met Tyr Ala Gly Leu Met Pro Asp Lys Lys Phe Thr 

1350 1355 1360 

aag cag tat gtg gcc agg ctg gag ggc gat gga teg gag tac cct gat 6583 
Lys Gin Tyr Val Ala Arg Leu Glu Gly Asp Gly Ser Glu Tyr Pro Asp 

1365 1370 1375 

ccg gag gtc tat gaa gtg ctg ggc gat gat gat ttt gat gga att ggt 6631 
Pro Glu Val Tyr Glu Val Leu Gly Asp Asp Asp Phe Asp Gly lie Gly 
1380 1385 1390 1395 

ttc aca ggg aat ggc gat tat tag tcgggttgct tggagggggc cgctgcatcc 6685 
Phe Thr Gly Asn Gly Asp Tyr 
1400 



ttatttttct gattttccga gtctttggtg ctgggaatgg gaatcttctg accatgttcc 6745 ^. 
ctatgggtga gtgctcattt tatggacttc agttttggag ttttctttcg gctttgagat 6805 
ctgcctgagc aagcgaggcg tgggacattc ggttggtcgc tagaacataa aacgaaaatg 6865 
ggagatgata tgattcttcg tggcgtgata atattgagat atttgggtgc tgtgctttgt 6925 
atccatgtcg cagatattcg ttcctacttg ttgcccgcga agcagatttg gtccaacttt 6985 
caaacaatag tcagcaacct tgaggaaact atcgatctcg atacagacgc ttagaataaa 7045 
tagcgtcctc gctcccttag cctccgacct ccatcctagg tggagcaccc gggatctcct 7105 
agactccttt cagacctgtc taagtgagat atatagtgca aagcagttgg tgttacactt 7165 
tggtattaca tcaacaagac aatttgagat agactcattc cctccggttt tcttccgatt 7225 
gcgactctat ttgatgattt tttttccatc tacccctgac aagcataact ctagcaaatc 7285 
tttttgctga atgaatgtag gctctttggg atttcgaggt tttgaccttg aaacctttga 7345 
tcttttgttc ttttgccttt tcgttgagtt ggaaagtata tcaactctac ctgatcacat 7405 
cggaagcaac aacaacaaca acaacaacaa caacaacaac aacaacaaca acaacaacaa 7465 
caacaacaac aacaacaaca acaacaacaa caacaacaac aacaacaaca acaacaacaa 7525 
caacaacaac aacaacaaca acaacaacaa caacaacaac aacaacaaca acaacaacaa 7585 
caacaacaac aacaacaaca acaacaacaa caacaacaac aacaacaaca acaacaacaa 7645 
cagcaacaac aacaacaaca acaacaacaa caacaacaac aacaagacaa caacaagaca 7705 
actatcaggt ttaacctcag taccatttgt aacagaccga gcgacctcat agcttatggg 7765 
aaaataatac acgtccagag atacataaca aatacagcaa caacaatgaa gttcaaagag 7825 
tttctcgccc gccgttccac caccaccagc accaccacca cccacagcat aaacctcgag 7885 
tgtatgagtg acgagtacaa catgaaccgt cgacgatccc tatagtgagt cgtattatgc 7945 



ggccgcgaat tcgatatcaa gcttatcgat accgtcgacc tcgagggggg gcccggtacc 8005 
caattcgccc tatagtgagt cgtattacaa tcccagtcac 8045 



<210> 2 
<211> 1402 
<212> PRT 

<213> Neurospora crassa 
<400> 2 

Met Asn Pro lie Thr Pro Arg Lys Arg Asn Ser Pro Val Glu Glu lie ^ 
15 10 15 ^ 

lie Asn Arg Leu Asn Asn Asp Tyr Asn Leu Gly Leu Gin Cys Val Ala 

20 25 30 

Asp Thr Thr Leu Thr Pro His Arg Arg Lys Glu Leu Ala Glu Ser Asp 
■ 35 40 45 

sr., .511 

Glu Asp Phe Gly Arg His Asp Lys lie Tyr Arg Ala Leu Asn Phe Leu . 
50 55 60 . 
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Tyr Tirp Arg Lys Asp Asp Ser Leu Asn Gin Ala Glu Ala Asn Phe Phe 
65 70 75 80 

lie Glu Ala Lys Ala Ala Ser Ser Asn Trp Val Pro Lys Ala His Ala ^ 

85 90 95 

Asp Pro Asp Thr Leu Pro Trp Ser Lys Glu Pro Pro Arg Ala Ala Thr 

100 105 110 

Ala Gly Gin Gin Trp Ala Leu Gin Thr Val Leu Leu Glu Val Leu Asn 

115 120 125 

Arg Phe Met Pro Pro Pro Asn Asn Thr Pro Gly Arg Thr Phe Gly Arg 

130 135 140 

Thr Leu Ser Gly Pro Ser Gly Leu Ser Arg Pro Thr Ser Thr Asn Thr 
145 . 150 155 160 

Lys Arg Lys Asp Glu Pro Ala Asn Val Thr Phe Ala Asp Pro Pro Lys 

165 170 175 

Arg Ser Leu Thr Arg Ser Ala Thr Gly Pro Pro lie His Gly Ala Ala 

180 185 190 

He Pro Leu Lys Phe Pro Asp Pro Val Asn Thr Gly Ser Lys Arg Pro 

195 200 205 

Ser Leu Glu Ser Glu Asn Leu Asn Gin Cys Thr Lys Arg Ala Lys Gly 

210 215 220 

Lys Leu Ser Asp Asn Val Ala Ala Ala Ala Ala Pro Pro Val Pro He 
225 230 235 240 



32 



Ala Ser Ala Leu Asp Lys Val Pro Thr Arg Arg His Ala Asn Thr Arg 

245 250 255 

Asp Pro Thr Ala Thr Gly His Arg Arg Ala Asp Gin Val Asp Ser Phe 

260 265 270 

Asp Thr Ser Gin Gly Thr Ser Tyr Gly Ser Ser Val Phe Ser Ala Cys 

275 280 285 

Arg His Asn Gin Ser Thr Thr Gin Ser Ser Phe Glu Ala Pro Pro Ser 

290 295 300 

Gin Pro Arg Glu Lys Arg Pro Val Asp Ala Thr Val Phe Glu Ala Gly 
305 310 315 320 

His Leu He Glu Ser Pro Ser Lys Gly Arg Thr Thr Lys Ser His He 

325 330 335 

Asp Asn Gin Pro Leu Ser Ser Ser Ser Gin Gly Glu Thr Ser Phe Ser 

340 345 350 

Thr Tyr Tyr Glu Ser Phe Pro Ser Ser Gly Gly Glu Gly Ala He Pro 

355 360 365 

Glu Pro Ser Arg Ser Asn Gly Leu Ala Arg Ser Glu Glu Ser Ala Arg 

370 375 380 

Ser Gin Val Gin Val His Ala Pro Val Val Ala Ala Arg Leu Arg Asn 
385 390 395 400 

He Trp Pro Lys Phe Pro Lys Trp Leu His Glu Ala Pro Leu Ala Val 

405 410 415 

Ala Trp Glu Val Thr Arg Leu Phe Met His Cys Lys Val Asp Leu Glu 

420 425 430 

Asp Glu Ser Leu Gly Leu Lys Tyr Asp Pro Ser Trp Ser Thr Ala Arg 

435 440 445 

Asp Val Thr Asp He Trp Lys Thr Leu Tyr Arg Leu Asp Ala Phe Arg 

450 455 460 

Gly Lys Pro Phe Pro Glu Lys Pro Pro Asn Asp Val Phe Val Thr Ala 
465 470 475 480 

Met Thr Gly Asn Phe Glu Ser Lys Gly Ser Ala Val Val Leu Ser Ala 

485 490 495 

Val Leu Asp Tyr Asn Pro Asp Asn Ser Pro Thr Ala Pro Leu Tyr Leu 

500 505 510 

Val Lys Leu Lys Pro Leu Met Phe Glu Gin Gly Cys Arg Leu Thr Arg 

515 520 525 

Arg Phe Gly Pro Asp Arg Phe Phe Glu He Leu He Pro Ser Pro Thr 
530 535 540 



Ser Thr Ser Pro Ser Val 
545 550 
Val Glu Glu Val He Gin 
565 

Gly Arg Gin Trp Arg Ala 
580 

Pro Leu Arg Glu Phe Gin 
595 

Lys Glu Arg Val His Phe 
610 

Asp Val Phe Lys Thr Arg 
625 630 
Gin Arg Thr Glu Phe Lys 
645 

Leu Asp Asn Asn Thr Trp 
660 

Gin Leu Gly Leu Ser Lys 
675 

Gin He Arg His His Lys 
690 

Glu Val Met Asn Asp Gly 
705 710 
Arg He Arg Asp Val Leu 
725 

Gly Arg. Phe Gly Ser Ala 
740 

Thr Gly Asp Glu Asp Trp 
755 

Glu Cys Asp Phe Val Asp 
770 

Val Ala Ser Glu Leu Lys 
785 790 
Val Leu Glu Asp Arg Ala 
805 

Gly Asp Arg Leu He Asn 
820 

His Ala Leu Asn Arg Pro 
835 



Pro Pro Val Val Ser Lys Gin Pro Gly Ala 
555 560 
Trp Leu Thr Met Gly Gin His Ser Leu Val 

570 575 
Phe Phe Ala Lys Asp Ala Gly Tyr Arg Lys 

585 590 
Leu Arg Ala Glu Asp Pro Lys Pro He He 

600 605 
Phe Ala Glu Thr Gly He Thr Phe Arg Pro 
615 620 

Ser Val Val Pro Ala Glu Glu Pro Val Glu 
635 640 
Val Ser Gin Met Leu Asp Trp Leu Leu Gin 

650 655 
Gin Pro His Leu Lys Leu Phe Ser Arg He 

665 . 670 

Thr Tyr Ala He Met Thr Leu Glu Pro His 

680 685 
Thr Asp Leu Leu Ser Pro Ser Gly Thr Gly 
695 700 

Val Gly Arg Met Ser Arg Ser Val Ala Lys 
715 720 
Gly Leu Gly Asp Val Pro Ser Ala Val Gin 

730 735 
Lys Gly Met Trp Val He Asp Val Asp Asp 

745 750 
He Glu Thr Tyr Pro Ser Gin Arg Lys Trp 

760 765 
Lys His Gin Arg Thr Leu Glu Val Arg Ser 
775 780 

Ser Ala Gly Leu Asn Leu Gin Leu Leu Pro 
795 800 
Arg Asp Lys Val Lys Met Arg Gin Ala He 

810 815 
Asp Leu Gin Arg Gin Phe Ser Glu Gin Lys 

825 830 
Val Glu Phe Arg Gin Trp Val Tyr Glu Ser 
840 845 



Tyr Ser Ser Arg Ala Thr Arg Val Ser His Gly Arg Val Pro Phe Leu 

850 855 860 

Ala Gly Leu Pro Asp Ser Gin Glu Glu Thr Leu Asn Phe Leu Met Asn 
865 870 875 880 

Ser Gly Phe Asp Pro Lys Lys Gin Lys Tyr Leu Gin Asp lie Ala Trp 

885 890 895 

Asp Leu Gin Lys Arg Lys Cys Asp Thr Leu Lys Ser Lys Leu Asn lie 

900 905 910 

Arg Val Gly Arg Ser Ala Tyr lie Tyr Met lie Ala Asp Phe Trp Gly 

915 920 925 

Val Leu Glu Glu Asn Glu Val His Val Gly Phe Ser Ser Lys Phe Arg 

930 935 940 

Asp Glu Glu Glu Ser Phe Thr Leu Leu Ser Asp Cys Asp Val Leu Val 
945 950 955 960 

Ala Arg Ser Pro Ala His Phe Pro Ser Asp lie Gin Arg Val Arg Ala 

965 970 975 

Val Phe Lys Pro Glu Leu His Ser Leu Lys Asp Val lie lie Phe Ser 

980 985 990 

Thr Lys Gly Asp Val Pro Leu Ala Lys Lys Leu Ser Gly Gly Asp Tyr 

995 1000 1005 

Asp Gly Asp Met Ala Trp Val Cys Trp Asp Pro Glu lie Val Asp Gly 

1010 1015 1020 

Phe Val Asn Ala Glu Met Pro Leu Glu Pro Asp Leu Ser Arg Tyr Leu 
025 1030 1035 1040 

Lys Lys Asp Lys Thr Thr Phe Lys Gin Leu Met Ala Ser His Gly Thr 

1045 1050 1055 

Gly Ser Ala Ala Lys Glu Gin Thr Thr Tyr Asp Met lie Gin Lys Ser 

1060 1065 107p 

Phe His Phe Ala Leu Gin Pro Asn Phe Leu Gly Met Cys Thr Asn Tyr 

1075 1080 1085 

Lys Glu Arg Leu Cys Tyr lie Asn Asn Ser Val Ser Asn Lys Pro Ala 

1090 1095 1100 

lie lie Leu Ser Ser Leu Val Gly Asn Leu Val Asp Gin Ser Lys Gin 
105 1110 1115 1120 

Gly lie Val Phe Asn Glu Ala Ser Trp Ala Gin Leu Arg Arg Glu Leu 

1125 1130 1135 

Leu Gly Gly Ala Leu Ser Leu Pro Asp Pro Met Tyr Lys Ser Asp Ser 
1140 1145 1150 



Trp Leu Gly Arg Gly Glu Pro Thr His lie lie Asp Tyr Leu Lys Phe 

1155 1160 1165 

Ser lie Ala Arg Pro Ala lie Asp Lys Glu Leu Glu Ala Phe His Asn 

1170 1175 1180 

Ala Met Lys Ala Ala Lys Asp Thr Glu Asp Gly Ala His Phe Trp Asp 
185 1190 1195 1200 

Pro Asp Leu Ala Ser Tyr Tyr Thr Phe Phe Lys Glu lie Ser Asp Lys 

1205 1210 1215 

Ser Arg Ser Ser Ala Leu Leu Phe Thr Thr Leu Lys Asn Arg lie Gly 

1220 1225 1230 

Glu Val Glu Lys Glu Tyr Gly Arg Leu Val Lys Asn Lys Glu Met Arg 

1235 1240 1245 

Asp Ser Lys Asp Pro Tyr Pro Val Arg Val Asn Gin Val Tyr Glu Lys 

1250 1255 1260 

Trp Cys Ala lie Thr Pro Glu Ala Met Asp Lys Ser Gly Ala Asn Tyr 
265 1270 1275 1280 

Asp Ser Lys Val lie Arg Leu Leu Glu Leu Ser Phe Leu Ala Asp Arg 

1285 1290 1295 

Glu Met Asn Thr Trp Ala Leu Leu Arg Ala Ser Thr Ala Phe Lys Leu 

1300 1305 1310 

Tyr Tyr His Lys Ser Pro Lys Phe Val Trp Gin Met Ala Gly Arg Gin 

1315 1320 1325 

Leu Ala Tyr lie Lys Ala Gin Met Thr Ser Arg Pro Gly Glu Gly Ala 

1330 1335 1340 

Pro Ala Leu Met Thr Ala Phe Met Tyr Ala Gly Leu Met Pro Asp Lys 
345 1350 1355 1360 

Lys Phe Thr Lys Gin Tyr Val Ala Arg Leu Glu Gly Asp Gly Ser Glu 

1365 1370 1375 

Tyr Pro Asp Pro Glu Val Tyr Glu Val Leu Gly Asp Asp Asp Phe Asp 

1380 1385 1390 

Gly lie Gly Phe Thr Gly Asn Gly Asp Tyr 
1395 1400 
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RIVENDICAZIONI 

1. Sequenza nucleotidica codificante per una proteina caratterizzata 
dal fatto di avere un'attivita di silenziamento e di comprendere un 
dominio di RNA polimerasi RNA-dipendente, in cui il dominio e 
omologo almeno per il 30% con la sequenza amminoacidica 
dairamminoacido 710 airamminoacido 1282 di SEQ ID No.1. 

2. Sequenza nucleotidica codificante per una proteina caratterizzata ^ 
dal fatto di avere un'attivita di silenziamento e di comprendere un 
dominio di RNA polimerasi RNA-dipendente secondo la rivendicazione 

1 in cui il dominio e omologo almeno per il 40% con la sequenza 
amminoacidica dairamminoacido 710 airamminoacido 1282 di SEQ ID 
No.1. 

3. Sequenza nucleotidica codificante per una proteina caratterizzata 
dal fatto di avere un'attivita di silenziamento e di comprendere un 
dominio di RNA polimerasi RNA-dipendente secondo la rivendicazione 

2 in cui il dominio e omologo almeno per il 50% con la sequenza 
amminoacidica dairamminoacido 710 airamminoacido 1282 di SEQ ID 
No.1, 

4. Sequenza nucleotidica codificante per una proteina caratterizzata 
dal fatto di avere un'attivita di silenziamento e di comprendere un 
dominio di RNA polimerasi RNA-dipendente secondo la rivendicazione 

3 in cui il dominio e la sequenza amminoacidica dairamminoacido 710 
airamminoacido 1282 di SEQ ID No.1. 
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5.. Sequenza nucleotidica codificante per una proteina caratterizzata 
dal fatto di avere un'attivita di silenziamento e di comprendere un 
dominio di RNA polimerasi RNA-dipendente secondo la rivendicazione 

4 in cui detta sequenza nucleotidica codifica per una proteina avente la 
sequenza amminoacidica di SEQ ID No.1, o porzioni funzionali di essa. 

6. Sequenza nucleotidica codificante per una proteina caratterizzata 
dal fatto di avere un'attivita di silenziamento e di comprendere un 
dominio di RNA polimerasi RNA-dipendente secondo la rivendicazione 

5 in cui detta sequenza nucleotidica e la sequenza nucleotidica di SEQ 
ID No.1 0 la sua sequenza complementare. 

7. Vettore di espressione comprendente sotto i! controllo di un 
promotore esprimibile in batteri la sequenza nucleotidica secondo una 
qualsiasi delle rivendicazioni da 1 a 6. 

8. Vettore di espressione comprendente sotto ii controllo di un 
promotore esprimibile in piante o in parti di esse la sequenza 
nucleotidica secondo una qualsiasi delle rivendicazioni da 1 a 6, in 
orientamento senso o antisenso. 

9. Vettore di espressione comprendente sotto il controllo di un 
promotore esprimibile in funghi la sequenza nucleotidica secondo una 
qualsiasi delle rivendicazioni da 1 a 6, in orientamento senso o 
antisenso. 

10. Vettore di espressione comprendente sotto il controllo di un 
promotore esprimibile in animali la sequenza nucleotidica secondo una 
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qualsiasi delle rivendicazioni da 1 a 6, in orientamento senso o 
antisenso. 

11. Organismo procariotico trasformato con il vettore di espressione in 
batteri secondo la rivendicazione 7. 

12. Pianta o parti di essa trasformata con il vettore di espressione in 
piante secondo la rivendicazione 8. 

13. Pianta mutata nella sequenza nucleotidica secondo una qualsiasi 
delle rivendicazioni da 1 a 6 con un'attivita di silenziamento ridotta o 
inibita. 

14. Fungo trasformato con il vettore di espressione in funghi secondo 
la rivendicazione 9. 

15. Fungo mutato nella sequenza nucleotidica secondo una qualsiasi 
delle rivendicazioni da 1 a 6 con un'attivita di silenziamento ridotta o 
inibita. 

16. Animate non umano trasformato con il vettore di espressione in 
animali secondo la rivendicazione 10. 

17. Animale non umano mutato nella sequenza nucleotidica secondo 
una qualsiasi delle rivendicazioni da 1 a 6 con un'attivita di 
silenziamento ridotta o inibita. 

18. Proteina caratterizzata dal fatto di avere un'attivita di silenziamento 
e di comprendere un dominio di RNA polimerasi RNA-dipendente, in 
cui il dominio e omologo almeno per il 30% con la sequenza 
amminoacidica dairamminoacido 710 all'amminoacido 1282 di SEQ ID 
No,1. 
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19. Proteina caratterizzata dal fatto di avere un'attivita di silenziamento 
e di comprendere un dominio di RNA polimerasi RNA-dipendente 
secondo la rivendicazione 18 in cui ii dominio e omologo almeno per il 
40% con la sequenza amminoacidica dairamminoacido 710 \: 
airamminoacido 1282 di SEQ ID No.1. 

20. Proteina caratterizzata dal fatto di avere un'attivita di silenziamento 

e di comprendere un dominio di RNA polimerasi RNA-dipendente ^ 
secondo la rivendicazione 19 in cui il dominio e omologo almeno per il ^ 
50% con la sequenza amminoacidica dall'amminoacido 710 @ 
all'amminoacido 1282 di SEQ ID No.1. 
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21. Proteina caratterizzata dal fatto di avere un'attivita di silenziamento 



e di comprendere un dominio di RNA polimerasi RNA-dipendente 
secondo la rivendicazione 20 in cui il dominio e la sequenza § 
amminoacidica dairamminoacido 710 airamminoacido 1282 di SEQ ID 
No.1. 

22. Proteina caratterizzata dal fatto di avere un'attivita di silenziamento 
e dl comprendere un dominio di RNA polimerasi RNA-dipendente 
secondo la rivendicazione 21 comprendente la sequenza 
amminoacidica di SEQ ID No.1, o porzioni funzionali di essa. 

23. Uso della sequenza nucleotidica secondo una qualsiasi delle 
rivendicazioni da 1 a 6 per la modulazione del silenziamento genico in 
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